#Dems Hassabis
短期內網際網路將因AI Agent優先而大變|DeepMind CEO+Google聯合創始人圓桌實錄
Google DeepMind 首席執行官Dems Hassabis 、Google 聯合創始人Sergey Brin與Big Technology Podcast 主持人Alex Kantrowitz進行了一場圓桌論壇。圓桌對話深入探討了AGI的真正定義、實現路徑、所需能力(包括對情感的理解),並就其出現的時間表達了各自的預測。此外,對話還延展至自我改進型AI的研發理念、多模態AI Agent與智能眼鏡等互動形態的未來、從Google Glass等過往項目中汲取的經驗教訓、AI生成內容帶來的挑戰等話題。以下是本次對話實錄 經數字開物團隊編譯整理01. 前沿模型的潛力與進展驅動力Alex Kantrowitz:我是Alex Kantrowitz,Big Technology Podcast 的主持人。今天,我非常榮幸能與兩位重量級嘉賓共同探討 AI 的最前沿動態:其中一位是 DeepMind 首席執行官 Demis Hassabis。Google DeepMind。Demis,非常高興見到你。Demis Hassabis:我也非常高興見到你。Alex Kantrowitz:同時,我們還邀請到了一位特別嘉賓,Google 聯合創始人 Sergey Brin 也親臨現場。好了,相信接下來的對話將會非常富有洞察力。讓我們從前沿模型談起。Demis,這個問題想請教您:基於我們當前對前沿模型的認知,其潛力還有多大程度能夠被釋放?以及,為何有如此多傑出人士認為相關領域的進展即將趨緩?Demis Hassabis:我認為我們正在見證著令人矚目的進展。各位今天都已在主題演講中目睹了我們所展示的各項卓越成果。因此,我認為我們通過將現有技術發揮到極致,正在取得巨大的成就。但與此同時,我們也在持續不斷地催生新的發明。而且我深信,要完全實現像AGI 這樣的宏偉目標,或許還需要一至兩個全新的突破。目前,我們有很多極具前景的構想正在積極研發中,並期望能將它們整合進 Gemini 分支的主幹。Alex Kantrowitz:好的。關於規模的討論一直不絕於耳。規模本身能否解決所有問題?或者說,它並非萬能?因此我想請問,從當前可實現的改進來看,規模依舊是核心驅動力,抑或只是一個輔助角色?Demis Hassabis:我個人的看法是,這兩者始終是相輔相成的。你需要將已掌握的技術進行最大限度的規模化部署,充分挖掘其潛力,這既包括資料規模,也包括計算規模。與此同時,你也必須投入大量資源來研發下一代技術。或許在未來六個月或一年後,你就能迎來下一次重大創新,這種創新可能會在某個層面帶來十倍的性能躍升,並與此前的規模化成果相互促進,相得益彰。因此,在我看來,兩者都至關重要。不過Sergey,您對此有何見解?Sergey Brin:我同意Demis 的看法,兩者都不可或缺。技術進步可以體現在演算法改進,也可以是純粹的計算能力提升,例如:更先進的晶片、更多的晶片數量、更強大的算力以及規模更龐大的資料中心。回顧歷史,以 N 體問題和引力體模擬這類複雜問題為例,你會發現,即便考慮到摩爾定律的影響,演算法層面的進步實際上也超越了計算能力本身的進步。如果讓我大膽預測,我會說演算法的進步未來可能會比計算能力的進步更具決定性意義。但目前,這兩方面都在齊頭並進。因此,我們正享受著雙重紅利。02. 資料中心的角色與推理時計算的重要性Alex Kantrowitz:Demis,那麼在您看來,貴公司所取得的重大進展,其主要驅動力是源自於建設更大規模的資料中心和採用更多的晶片嗎?例如,現在有一種普遍的說法,認為未來整個世界都將被資料中心所覆蓋。這是否是您所預見的未來圖景?Demis Hassabis:並非完全如此。我們毫無疑問將需要興建更多的資料中心。從科學的視角來看,我們能夠將普通的沙子轉化為具備思考能力的機器,這本身就是一項至今仍令我讚歎不已的成就,確實非同凡響。但關鍵在於,資料中心的建設並不僅僅是為了滿足模型訓練的需求。如今,我們開發出的這些先進模型,受到了全球使用者的熱捧。我們觀察到市場對2.5 Pro 版本有著極為旺盛的需求,同時,我也認為 Flash 模型的表現著實令人振奮,它以極具吸引力的低成本實現了超乎尋常的性能。我預見,全世界都將渴望運用這些技術。因此,我們將需要大量的資料中心來支援模型服務以及進行推理時計算。正如各位今天所見證的 DeepThink 和 2.5 Pro DeepThink,你賦予它越多的思考時間,它的表現就會越出色。對於某些具有極高價值且極度複雜的任務而言,投入充裕的時間讓模型進行深度思考,無疑是值得的。我們正在積極探索如何將這一能力推向新的高度。而這,同樣離不開在模型執行階段大量晶片資源的支撐。Alex Kantrowitz:好的,您剛才提到了推理時計算。我們採用這種推理範式大致已有一年時間。在過去,您和我也曾兩次深入探討過這個話題,認為它或許可以作為一種有效的增強機制,被整合到傳統的大語言模型(LLMs) 中,以獲取性能上的提升。因此,我想現在是一個絕佳的時機來請教您:目前這方面的具體進展如何?您能否幫助我們更清晰地理解,推理能力的引入究竟帶來了多大程度的改進?Demis Hassabis:我們向來都對我們現在稱之為思維範式的理念深信不疑。回顧我們早期在AlphaGo 和 AlphaZero 等里程碑項目上的探索,以及我們在遊戲領域的 AI Agent 研究工作,這些系統無一例外都具備了在基礎模型之上建構一個思維繫統的核心特質。實際上,以國際象棋或圍棋這類複雜博弈為例,你可以精確地量化這種思維能力所帶來的差異。我們曾經開發過關閉了思維功能的 AlphaGo 和 AlphaZero 版本,在那種模式下,模型僅僅是輸出它基於模式匹配的“第一直覺”。坦率地說,其表現尚可,大約能達到大師級的水準。然而,一旦開啟其思維功能,它的能力便會遠遠超越人類世界冠軍的水平。這兩個版本之間的 Elo 等級分差距,足足有 600 分之多。因此,在遊戲領域,這種差異是清晰可見的,更遑論遠比遊戲更為複雜的真實世界了。我堅信,通過在現有模型基礎上疊加這種思維範式,其所能釋放的潛力將會更加巨大。當然,其中面臨的挑戰在於,你的模型——正如我先前在演講中提及的——必須具備一種世界模型的能力。建構這樣的模型,其難度自然遠超建構一個簡單遊戲的模型。並且,模型自身不可避免地會存在謬誤,這些謬誤在長期的規劃與決策過程中可能會被逐步放大並累積。儘管如此,我認為我們目前在所有這些相關前沿上都取得了長足的進步。Sergey Brin:正如Demis 所闡述的,DeepMind 的確在強化學習這一領域取得了諸多開創性的成就。他們通過 AlphaGo 和 AlphaZero 所完成的工作,正如您剛才提到的,清晰地證明了——我記得的資料是——若要達到與具備推理時計算能力的 AlphaGo (在投入大量訓練之後) 相匹敵的水平,單純依靠增加訓練資料,可能需要高達 5000 倍的訓練量。這無疑彰顯了推理能力的巨大優勢。而且,顯而易見的是,正如我們多數人一樣,在開口講話之前進行一番思考總能帶來益處,儘管……Alex Kantrowitz:並非總是如此。Sergey Brin:我也時常被人提醒要三思而後言。但我認為,AI 系統在被賦予這種思考能力之後,其整體性能無疑會得到極大的增強。從這個角度看,我認為我們目前所取得的成就,還僅僅是冰山一角。畢竟,這些先進模型真正進入公眾視野尚不足一年時間。Demis Hassabis:尤其值得注意的是,一個AI 在其思考過程中,還可以靈活運用一系列的工具,甚至呼叫其他的 AI 系統來協同工作,從而持續最佳化並提升最終輸出結果的質量。因此,我堅信這將發展成為一種極其強大的範式。03. DeepThink是實現AGI關鍵突破的組成部分Alex Kantrowitz:DeepThink 的理念非常引人入勝。我嘗試對其進行描述,請您看是否精準:它本質上是啟動一系列平行推理過程,這些過程同步運作並相互進行驗證與校對,最終實現一種堪稱“超強版”的推理。Demis,您曾提到,整個行業還需要幾項關鍵的技術突破才能最終實現 AGI。那麼,您會將 DeepThink 這種機制置於何種戰略地位?它是否屬於那些能夠引領行業向 AGI 更近一步的關鍵技術之一?Demis Hassabis:我認為是這樣的。它或許是某一關鍵突破的組成部分。我們不妨這樣說。當然,還有其他重要的方面,例如,我們仍需大幅提升系統的推理能力,而DeepThink 或許能在這方面扮演重要角色。真正的科學發現或技術發明究竟源自何處?它並不僅僅是解決一個已知的數學猜想,更在於能夠提出全新的猜想,或是在物理學等領域建構並驗證全新的理論假設。坦率地說,我認為我們目前所擁有的系統,尚不具備實現此類高級創造力的能力。但我堅信,這樣的系統正在逐步向我們走來。而諸如“思考”這樣的範式,以及與之相關的技術,可能會在這一處理程序中發揮關鍵作用。此外,可能還涉及許多其他因素。我的意思是,我認為我們需要在所建構的世界模型的精確度方面取得一系列重大進展。我想各位通過 Veo,尤其是 Veo 3 的演示,已經初步領略到了這種潛力——它能夠憑藉直覺理解光影流轉和重力效應的內在物理規律,這著實令我歎為觀止。我早期的職業生涯曾專注於電腦遊戲的開發,那不僅僅涉及 AI 程式設計,還包括圖形引擎的建構。我至今仍清晰記得,在那個時代,我們必須手動完成所有的渲染細節,包括複雜的光照計算和著色器程式設計——這些都是早期遊戲開發中極其繁瑣和精密的工作。而如今,模型能夠在內部憑直覺直接領悟並再現這些複雜現象,這無疑是一項驚人的成就。Alex Kantrowitz:我注意到您之前分享了一張圖片,畫面是一個煎鍋,裡面有洋蔥和一些油。這其中應該沒有任何潛意識資訊的傳遞吧?Demis Hassabis:並沒有。完全沒有。或許,只是一個非常、非常細微的暗示。僅此而已。04. 會有單一實體率先達到AGI的某個階段,隨後其他實體跟進Alex Kantrowitz:我們已經數次提及AGI 這個術語了。我觀察到,在當前的 AI 研究領域,似乎出現了一種傾向,即建議不再使用 AGI 一詞,理由是它已被過度使用,以至於在某種程度上失去了其原有的精確含義。但 Demis,您似乎仍然認為這個概念至關重要。能否請您闡述一下原因?Demis Hassabis:我堅信AGI 仍然是一個非常重要的概念。關於這一點,或許我需要與 Shane Legg——他是我們的首席科學家,也是大約 25 年前首批定義並推廣這個術語的學者之一——共同撰寫一些更系統的論述。我認為,目前存在兩種不同的理解,並且它們在一定程度上被混淆了。第一種理解關注的是:一個典型的普通人,一個個體,通常能夠完成那些任務?我們知道,人類個體都具備相當的能力,但無論個人能力多強,每個人所能精通和擅長的領域終究是有限的。或者換一種說法,你能做到的事情,或許社會上 90% 的人也都能做到。實現這種水平的 AI,無疑將在經濟層面和產品應用層面產生巨大價值,因此它是一個非常重要的里程碑。所以,或許我們可以將這一定義稱為“通用水平的人類智能”。但我個人更感興趣,並且我傾向於稱之為 AGI 的,實際上是一個更具理論性的構造。它探討的是:人類大腦作為一種獨特的生物架構,其所能達到的認知和能力的上限究竟是什麼?人類大腦之所以是一個至關重要的參考點,是因為它是目前我們在宇宙中所知的、唯一能夠證明通用智能這種現象確實可能存在的實例。因此,一個真正的 AGI 系統,必須能夠證明它有能力完成那些歷史上最傑出的人類——例如愛因斯坦、莫扎特、瑪麗·居里等等——憑藉其同樣的大腦生物架構 (請注意,這裡強調的是大腦的通用架構,而非某一個特定個體的大腦) 所能完成的各種複雜任務和智力壯舉。對我而言,顯而易見的是,當今的 AI 系統尚不具備這種等級的能力。另一方面,之所以我認為當前圍繞 AGI 的某些討論顯得有些言過其實,是因為我們現有的 AI 系統在表現的穩定性和一致性方面,還遠遠沒有達到可以被認為是“完全通用”的程度。誠然,它們已經具備了相當廣泛的通用性,能夠執行成千上萬種不同的任務,各位今天也親眼見證了許多令人印象深刻的演示。然而,我們每個人在與當今的聊天機器人或智能助手互動時,幾乎都能在短短幾分鐘內輕易地發現它們存在的某些明顯缺陷。例如,某個高中水平的數學題它們可能無法正確解答,或者某款基礎的電腦遊戲它們可能玩不轉。在現有系統中找出這類系統漏洞並非難事。在我看來,一個系統若要真正配得上 AGI 的稱號,它必須在各種任務和情境下都表現出遠超今日水平的穩定性和一致性。理想情況下,應該需要一個頂尖的專家團隊,花費數月的時間進行深入測試和評估,才有可能發現其中一個較為明顯的漏洞。然而現實是,如今任何一個普通使用者都可能在短短幾分鐘內就找出這樣的問題。Alex Kantrowitz:Sergey, 這個問題很適合你。你認為 AGI 會由一家公司率先實現,然後一切就塵埃落定了嗎?或者你認為會出現 Google、OpenAI、Anthropic 以及中國都擁有 AGI 的局面嗎?Sergey Brin:這確實是個很好的問題。我傾向於認為,會有一個公司、國家或實體首先達到AGI。不過,AGI 更像一個連續的譜系,它並非一個絕對精確的界定,所以可以想見,可能會有不止一個實體大致同時處於那個範圍。至於之後會發生什麼,我覺得很難預料。但你完全可以想像,屆時會有多個實體湧現。在我們人工智慧 (AI) 領域,當一方取得某種進展,其他公司會迅速跟進,反之亦然,當其他公司取得某些進展時,這就形成了一種持續的交替領先局面。所以我確實認為這其中有一種激勵效應,它可能會鼓勵越來越多的實體跨越那個門檻。Demis Hassabis:我確實認為,對整個領域而言,就AGI 的定義達成一致非常重要,所以也許我們應該努力推動這一共識的形成。假定有了明確定義,可能會有一些組織率先達到。而且我認為,關鍵在於這些初始系統必須被可靠且安全地建構出來。在那之後,如果情況如此,我們可以設想利用這些初始系統派生出許多具有安全架構的系統,這些架構是在其可證明的安全基礎上建構的。然後,你就可能擁有個人 AGI 以及各種各樣的事物。但是,正如 Sergey 所說,這非常難以預測,這有點像試圖超越事件視界去預測未來景象。Alex Kantrowitz:我們剛才稍微討論了一下AGI 的定義。很多人認為 AGI 必須是知識層面的,即大腦的智能。那麼情感層面的智能呢?Demis,簡單來說,AI 必須具備情感才能被認為是 AGI 嗎?它能夠擁有情感嗎?Demis Hassabis:我認為AI 需要能夠理解情感。至於是否要讓它模仿情感,我認為這更像是一個設計上的抉擇。理論上,我看不出它為什麼不能擁有情感。但 AI 的情感可能與人類不同,或者我們可能認為沒有必要,甚至不希望它們擁有像我們人類那樣的情感反應。所以我再次認為,隨著我們越來越接近 AGI 的時間節點——我認為這更像是一個 5 到 10 年的時間尺度——我們還有一些時間,雖然不多,但足以去研究這類問題。05. 追求的受控制的智能爆炸Alex Kantrowitz:當我思考時間框架如何可能縮短時,我好奇這是否會源於自我改進系統的建立。上周,當我讀到一條關於AlphaEvolve 的新聞標題時,我差點從椅子上摔下來——那是一個能夠幫助設計更優演算法,甚至改進大語言模型訓練方式的 AI。所以,Demis,你是在試圖引發一場智能爆炸嗎?Demis Hassabis:不,我們追求的並非不受控制的智能爆炸。我認為AlphaEvolve 是一個有趣的初步實驗。這是一個卓越的系統,由一個出色的團隊研發。現在令人感興趣的是,開始將其他類型的技術——在這個案例中是進化程式設計技術 ——與日益強大的最新基礎模型 相結合。我非常希望在我們的探索性工作中看到更多這類組合系統,以及各種不同方法的融合。你說得對,自我改進確實是關鍵因素之一,如果有人能發現一種自我改進循環那可能會使進展速度遠超現在。我們之前在自己的工作中也見證過類似情況,比如AlphaZero,它能在 24 小時內從零開始,通過自我改進過程學會國際象棋、圍棋以及任何雙人對弈遊戲。所以我們知道這是可能實現的。但同樣,這些成果都侷限於規則非常明確的有限遊戲領域。現實世界要混亂和複雜得多。因此,這類方法能否在更廣泛的領域有效,仍有待觀察。06. 當前是電腦科學家投身AI事業的獨特歷史時刻Alex Kantrowitz:Sergey,我們討論了一些非常強大的系統,而開發這些系統無疑是一場競賽。這便是你回歸 Google 的原因嗎?Sergey Brin:我認為,作為電腦科學家,我們正處在歷史上一個非常獨特的時刻。坦率地說,任何電腦科學家現在都不應該退休,而應該投身於AI 事業。這就是我的看法。可以說,我們從未面臨過如此重大的課題與機遇,也從未處在如此關鍵的技術浪潮之巔。所以,我不會說回歸是因為競賽——儘管我們確實計畫讓 Gemini 成為第一個 AGI,這一點需要明確。更重要的是能夠沉浸在這場令人難以置信的技術革命之中。這與我經歷過的 Web 1.0 時代不同,那個時代雖然也非常激動人心,後來我們又有了移動技術等等,但我認為 AI 在科學層面上遠比那些更令人振奮。而且我堅信,AI 最終對世界的影響將更為深遠。儘管網際網路和行動電話已經產生了巨大影響,但我認為 AI 將帶來遠為深刻的變革。Alex Kantrowitz:那麼你日常主要做些什麼呢?Sergey Brin:我想我主要是在“折磨”像 Demis 這樣的人——順便說一句,他非常了不起,容忍了我“闖入”這次爐邊談話。我幾乎每天都在公司 (就在街對面)。那裡有許多人正在研究關鍵的 Gemini 文字模型,進行預訓練 (pre-training) 和後訓練 (post-training) 的工作。我的工作主要與他們相關,同時我也會定期參與一些多模態 (multimodal) 方面的工作,比如你們都見過的 Veo。我傾向於深入鑽研技術細節,這對我來說是一種非常享受的“奢侈”,幸運的是,有像 Demis 這樣的人在負責日常管理運作。我的科學興趣就在於此,深耕於演算法及其演進方式。07. AI Agent的未來:多模態互動與物理世界理解Alex Kantrowitz:我們來談談產品,特別是最近發佈的一些產品。Demis,我想問你一個關於 AI Agent 的寬泛問題。因為當我觀察其他科技公司建構 AI Agent 時,我們在演示中看到的通常是具備情境感知能力、擁有無實體聲音、並且主要通過螢幕進行互動的系統。但當我看到 DeepMind 和 Google 的演示時,互動往往是通過攝影機進行的,非常側重視覺。今天也發佈了關於智能眼鏡的消息。所以,請談談我的這種解讀是否精準,以及為什麼 Google 對開發一個能像你一樣觀察世界的助手或伴侶如此感興趣?Demis Hassabis:這背後有幾個原因,幾條思路在此交匯。首先,正如我們之前討論的,我們一直對AI Agent 抱有濃厚興趣。這實際上是 DeepMind 的傳承所在,我們最初就是從遊戲領域中基於 AI Agent 的系統起步的。我們致力於建構 AGI,即一種完全的通用智能 (full general intelligence)。顯然,AGI 必須能夠理解物理環境,也就是你周圍的真實世界。在我看來,這其中兩大核心應用場景:一是打造一個真正實用的助手,它能陪伴你融入日常生活,而不僅僅侷限於電腦或某個特定裝置。我們希望它能在日常生活的方方面面都發揮作用,因此它需要時刻伴隨你左右,並理解你所處的物理情境。另一個重要方面是,我一直認為要讓機器人技術取得突破,我們期待的正是像在 Astra 項目中看到的那種應用於機器人的智能。我始終覺得,機器人技術的瓶頸並不主要在於硬體——儘管有許多公司在研發卓越的硬體,我們也與其中不少公司有合作——而真正制約其發展的是軟體智能。但我相信,我們正處在一個激動人心的時刻。最終,伴隨著最新版本的 Gemini (特別是 2.5 版本) 以及我們將引入的更多新技術,例如 Veo 技術等,我們將擁有非常出色的演算法,從而使機器人技術最終能充分發揮其巨大潛力。所以,最終 AGI 需要具備所有這些能力。因此,對我們而言——這也是你們可以看到的,我們始終秉持這一理念——Gemini 從一開始,即便在最早的版本,就被設計為多模態。這在初期無疑增加了難度,因為實現多模態比純文字處理要複雜得多。但我認為,我們現在正從當初的這些決策中獲益。我看到許多 Gemini 團隊的核心成員就坐在前排,我們做出了正確的決策。這些決策雖然在當時更為艱難,但卻是正確的,如今你們可以從今天展示的所有成果中看到這一點。08. 通用助手才是智能眼鏡的殺手級應用Alex Kantrowitz:Sergey,我一直在猶豫要不要問你一個關於 Google Glass 的問題。Sergey Brin:請講。Alex Kantrowitz:既然智能眼鏡似乎再度興起,那麼你從Google Glass 項目中學到的那些經驗,是 Google 今天可以應用的呢?Sergey Brin:這確實是個很好的問題。我確實學到了很多。坦白說,我覺得自己在Google Glass 項目上犯了不少錯誤。但我依然堅信這種外形規格 (form factor) 的潛力,所以很高興我們現在又擁有了它,而且新款看起來就像普通眼鏡,沒有了之前前面那個部件。老實說,我認為當時存在技術上的差距。如今在 AI 時代,這些眼鏡在為你提供幫助而又不過度分散你注意力的能力已經大大增強了。此外,當時我對消費電子供應鏈幾乎一無所知,不瞭解以一個合理的價位 (price point) 把它製造出來、管理所有生產環節等等有多麼困難。這一次,我們有優秀的合作夥伴來幫助我們完成製造。所以這又是向前邁進了一步。還能說什麼呢?我不得不承認,我確實很懷念當年發佈會上那艘載著翼裝飛行跳傘員的飛艇所做的演示。老實說,如果在Shoreline Amphitheatre 這裡重現,會比當年在 Moscone 中心更酷。不過,這次我們或許應該先把產品打磨好。等它準備就緒、可以上市之後,我們再做一個非常酷的演示。這或許是更明智的做法。Demis Hassabis:我們在眼鏡形態裝置和智能裝置方面顯然擁有非常豐富的歷史經驗。因此,我們可以將所有這些經驗教訓應用於今天。正如你所見,我對我們的新款眼鏡感到非常興奮。我一直與我們的團隊,包括Sharam 等人討論的觀點是——我不知道 Sergey 是否會同意——但我認為,通用助手才是智能眼鏡的殺手級應用。我認為這才是使其成功的關鍵。除了各項技術,尤其是硬體技術本身也取得了長足進步和巨大改進之外,我深信,這才是它真正的、天作之合的殺手級應用。09. AI生成內容的挑戰與應對:SynthID與合成資料Alex Kantrowitz:我們簡單談談視訊生成。今天在主題演講的觀眾席,我對這些模型展現出的進步印象深刻。實際上,演講中也有電影製作人談及此事。Demis,我想特別請教您關於模型質量的問題:如果網際網路上充斥著AI製作的視訊,這些視訊隨後又被用於模型訓練,是否會導致模型質量相較於僅使用人類原創內容訓練的模型有所下降?Demis Hassabis:目前確實有很多關於所謂模型崩潰的擔憂。視訊只是一方面,任何模態,包括文字,都存在此問題。關於這點,有幾項需要說明。首先,我們在資料質量管理和策展方面非常嚴格。其次,至少我們所有的生成式AI 模型都加入了 SynthID。這是一種由AI製作的隱形水印,非常穩健,自發佈以來已歷經一年到一年半的考驗。我們所有的圖像和視訊都嵌入了此水印,因此我們可以檢測出來。我們也在發佈工具讓任何人都能檢測這些水印,從而識別出那是AI生成的圖像或視訊。這對於打擊深度偽造和虛假資訊固然重要,但如果你願意,當然也可以用它來從訓練資料中過濾掉任何不想要的內容。所以我並不認為這是個大問題。最終,我們可能會擁有非常出色的視訊模型,可以將其重新引入訓練循環,作為額外資料——即所謂的合成資料——的來源。這種情況下,必須非常小心,確保實際上是從與模型目標一致的相同分佈中建立資料,不以任何方式扭曲該分佈,並且保證足夠高的質量。我們在一個完全不同的領域有過類似經驗,比如 AlphaFold 項目,當時並沒有足夠的真實實驗資料來建構最終的 AlphaFold。因此,我們不得不先建構一個早期版本,該版本預測了大約一百萬個蛋白質結構,然後根據其置信度篩選出前三四十萬個,並將其重新加入訓練資料。所以,將合成資料與真實資料混合是一項非常前沿的研究,有多種方法可以實現。但就視訊生成的內容而言,至少對我們自己的工作,如果需要是可以排除這些內容的。希望其他生成媒體公司也能效仿,加入強大的水印,其首要目的也是為了打擊深度偽造和虛假資訊。10. 短期內網際網路將因AI Agent優先而大變Alex Kantrowitz:好的,我們還有四分鐘,我剩下四個問題。現在進入我問題的雜項部分。看看我們能討論多少,以及能多快完成。這個問題給Sergey:10 年後的網際網路會是什麼樣子?Sergey Brin:10 年後的網際網路會是什麼樣子?天啊,考慮到 AI 的發展速度,我認為 10 年後的變化將遠超我們當前所能預見的一切,不僅僅是網際網路。我不知道,我們真的不知道 10 年後的世界會是什麼樣子。Alex Kantrowitz:Demis?Demis Hassabis:那是個不錯的答案。我確實認為,在更短期內,網際網路將會發生相當大的變化,特別是如果你考慮到一個AI Agent 優先的網路環境。例如,AI Agent 優先的網路不一定需要像我們人類使用網路那樣查看渲染介面等內容。因此,幾年後情況會大不相同。Alex Kantrowitz:這是一個關於時間點預測的問題:AGI 會在 2030 年之前還是之後出現?Sergey Brin:2030 年。天啊,你真是把時間點卡得非常微妙。我會說之前。Alex Kantrowitz:之前?Demis?Demis Hassabis:我認為是之後。Alex Kantrowitz:之後。Demis,別有壓力。我們得回去更努力地工作了。Sergey Brin:我可以提出要求,他需要負責實現。別再藏著掖著了!我們下周就需要這個成果。Demis Hassabis:的確如此。Alex Kantrowitz:我會來驗收的。那麼,Demis,你會僱傭在面試中使用了 AI 的人嗎?Demis Hassabis:在面試中使用AI?這取決於他們如何使用。若使用當今的模型和工具,或許不會。但這實際上要看具體的使用方式。Alex Kantrowitz:Sergey?Sergey Brin:我從未參加過任何面試,所以我不知道。我覺得由我來評判別人如何面試會顯得很虛偽。Demis Hassabis:我其實也沒有參加過。所以,我在這方面確實沒什麼經驗,從未有過工作面試的經歷。Alex Kantrowitz:Demis,我一直在看你的推文。你發了一條非常有趣的推文,其中有一個提示生成了某種自然場景。Demis Hassabis:哦是的。Alex Kantrowitz:推文是這樣的:“一鍵即可將自然轉化為模擬,這確實引人深思,”後面附帶了幾個表情符號。人們抓住了這一點大做文章,寫出了一些類似“Demis 認為我們身處模擬之中”的標題。我們真的在一個模擬之中嗎?Demis Hassabis:並非Nick Bostrom 和其他人所談論的那種方式。但我確實認為其意義不止於此,因此我不認為這僅僅是某種遊戲——儘管我開發過很多遊戲。我確實認為,物理學的最終基礎是資訊理論。所以我確實認為我們身處一個計算宇宙之中,但它並非一個簡單的直接模擬。這不是一分鐘內能解釋清楚的。但我認為,這些系統能夠模擬自然界中的真實結構,這一點本身就相當有趣且具有啟發性。我一直在深入思考我們通過 AlphaGo、AlphaFold 及此類系統所做的工作。我曾略微談及過此事,或許未來某個時候我會撰寫一篇科學論文,闡述我對現實世界中這一切究竟意味著什麼的看法。Alex Kantrowitz:Sergey,你有什麼驚世駭俗的觀點嗎?Sergey Brin:我認為這個論點可以遞迴應用。如果我們處於一個模擬之中,那麼根據同樣的邏輯,創造這個模擬的任何存在本身也可能處於另一個模擬之中,原因大致相同,如此無限循環下去。因此,你要麼接受我們處於一個無限層疊的模擬之中,要麼就必須存在某種終止條件。Alex Kantrowitz:你最好的猜測是什麼?Sergey Brin:我認為我們看待這個問題的視角非常以人類為中心。例如,當我們談論“模擬”時,通常指的是某種有意識的存在正在運行一個我們身處其中的模擬程序,並且這些存在擁有與我們相似的某種慾望和意識。在我看來,這種類比本身就存在問題。因此,我只是覺得我們或許並沒有能力去真正理解更高層級的存在或現實。Alex Kantrowitz:Demis、Sergey,非常感謝你們。這是一次極其引人入勝的對話。謝謝各位。 (數字開物)